ارائه راهکاری نوین برای انتخاب داده ها در الگوریتم های یادگیری مبتنی بر نمونه

پایان نامه
چکیده

الگوریتم نزدیکترین همسایه یکی از قدیمی ترین و ساده ترین روشهای غیر پارامتریک و پویای دسته بندی است. این الگوریتم می تواند با مجموعه کوچکی از نمونه های آموزشی یادگیری داشته باشد و داده های آموزشی خود را هر زمان که در دسترس باشند افزایش دهد. علی رغم مزایای الگوریتم نزدیکترین همسایه از قبیل سرعت بالا در زمان یادگیری و توانایی نمایش پیچیده ترین مرزهای تصمیم گیری، این روش دارای مشکلاتی مانند وابستگی کارآیی به معیار فاصله، نمونه های آموزشی نویزی و خصیصه های مورد استفاده می باشد. همچنین این الگوریتم از همه نمونه های آموزشی در زمان تصمیم گیری استفاده می کند که نتیجه آن، سرعت پایین دسته بندی و نیازمندی به حافظه زیاد است. این مشکل درمورد مجموعه داده های بزرگتر، ملموس تر است. در این رساله الگوریتمی معرفی شده است که به طور همزمان به دنبال یافتن یک مجموعه کاهش یافته از نمونه ها و تطبیق معیار فاصله با مسئله مورد حل، از طریق انتساب وزن به نمونه های منتخب می باشد. برای انتخاب نمونه ها یک الگوریتم خوشه بندی با ناظر و برای تطبیق معیار فاصله، الگوریتم یادگیری پیشنهاد شده است که سعی میکند با تنظیم وزن نمونه های منتخب، نرخ دسته بندی کنار گذاری تک به تک را ماکزیمم سازد. وزن یک نمونه برای محاسبه فاصله (و یا شباهت )آن نمونه آموزشی با نمونه مورد پرسش مورد استفاده قرار می گیرد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارائه راهکاری نوین برای بهبود الگوریتم های تکاملی چندهدفه مبتنی بر تجزیه

الگوریتم تکاملی چند هدفه مبتنی بر تجزیه (moea/d-de) یکی از الگوریتم های تکاملی است که به منظور برآورد نقاط بهینه پارتو با پیچیدگی کمتر محاسباتی در مسائل با ابعاد زیاد استفاده می شود. عملکرد الگوریتم moea/d-de به تنظیم مناسب پارامترهای کنترلی آن بستگی دارد و بهترین نحوه تنظیم این پارامترها تاثیر بسزای در افزایش توانایی و بهبود عملکرد آن دارد. یکی از این پارامترهای کنترلی ، پارامتر همسایگی می باش...

ارائه رویکردی نوین و خودکار به منظور تولید داده های تست مبتنی بر روشهای تصادفی

فرآیند تست 50% کل هزینه توسعه نرم افزار را شامل می شود. به منظور تست نرم افزار، باید مجموعه ای از داده‌های تست ایجاد شوند که تولید این مجموعه، کاری بسیار زمانبر بوده و تاثیر مستقیمی بر هزینه فرآیند تست خواهد داشت. بدون خودکارسازی، این فرآیند، کند، پرهزینه و همراه با خطا خواهد بود. در این مقاله روش جدیدی به منظور تولید داده های تست بر مبنای الگوریتمهای تصادفی با ترکیب روشهای ایستا و پویا ارائه ش...

متن کامل

یادگیری زدایی؛ راهکاری برای یادگیری بیشتر

  مقدمه: به رغم آگاهی فزاینده در مورد اهمّیت و ضرورت یادگیری، چگونگی، اشکال آن و رویه­هایی که یادگیری را در افراد و سازمان­ها تشویق می­کند، شناخت بسیار کمی درباره یادگیری­زدایی وجود دارد. چیستی یادگیری­زدایی، چرایی مهم آن و شرایطی که آن را ترغیب می­کنند، کمتر مورد بحث قرار گرفته­اند. با توجه به اهمّیت یادگیری­زدایی و نقش آن در فرآیند انتقال و اکتساب دانش، این مقاله به بررسی یادگیری­زدایی، ضرورت و...

متن کامل

ارائه راهکاری جهت تجمیع داده ها در سازمانها با استفاده از وب سرویس

Increasing the speed and reducing the use of resources in the data integration process has always been the goal of developers and researchers in the process of data integration. The purpose of this study is to provide a solution using metadata as well as web browsing to speed up the process, so as to improve resources such as memory. The proposed solution is implemented using the three-layer ar...

متن کامل

ارائه مدل انتخاب برای حسابرسی مالیاتی مبتنی بر ریسک

  چکیده انتخاب مؤدی بر اساس معیار ریسک و برنامه­ریزی حسابرسی، نیازمند شناسایی سطح ریسک هر مؤدی است و شناسایی ریسک هر مؤدی نیز مستلزم شناسایی عوامل مؤثر بر ریسک می باشد. در سازمان امور مالیاتی ایران، مدل کامل و جامعی جهت انتخاب مؤدیان بر پایه ارزیابی سطح ریسک و انتخاب مؤدی جهت حسابرسی وجود ندارد. در این تحقیق 15 متغیر مستقل به عنوان عوامل مؤثر بر ریسک تمکین اشخاص حقوقی شناسایی و در قالب 3 فرضیه ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023